Une mesure de similarité sémantique pour la classification de documents par le contenu
Identifieur interne : 006695 ( Main/Exploration ); précédent : 006694; suivant : 006696Une mesure de similarité sémantique pour la classification de documents par le contenu
Auteurs : Rim Al Hulou ; Amedeo Napoli ; Emmanuel NauerSource :
English descriptors
- KwdEn :
Abstract
Dans cet article, nous proposons une approche pour classifier des documents textuels à partir de leur contenu. Le contenu des documents est exprimé par des annotations représentées sous forme d'arbres. Étant donnée une hiérarchie d'annotations génériques, notre approche vise à rattacher une annotation spécifique à une ou plusieurs classes possibles dans la hiérarchie. Ce processus de classification repose sur une mesure de similarité qui permet de mesurer l'écart entre une annotation spécifique et une annotation générique. Un schéma d'algorithme de classification de documents est proposé à partir de cette mesure de similarité.
Affiliations:
Links toward previous steps (curation, corpus...)
- to stream Crin, to step Corpus: 003D30
- to stream Crin, to step Curation: 003D30
- to stream Crin, to step Checkpoint: 000556
- to stream Main, to step Merge: 006A23
- to stream Main, to step Curation: 006695
Le document en format XML
<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="fr" wicri:score="-67">Une mesure de similarité sémantique pour la classification de documents par le contenu</title>
</titleStmt>
<publicationStmt><idno type="RBID">CRIN:al_hulou04b</idno>
<date when="2004" year="2004">2004</date>
<idno type="wicri:Area/Crin/Corpus">003D30</idno>
<idno type="wicri:Area/Crin/Curation">003D30</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Curation">003D30</idno>
<idno type="wicri:Area/Crin/Checkpoint">000556</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Checkpoint">000556</idno>
<idno type="wicri:Area/Main/Merge">006A23</idno>
<idno type="wicri:Area/Main/Curation">006695</idno>
<idno type="wicri:Area/Main/Exploration">006695</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="fr">Une mesure de similarité sémantique pour la classification de documents par le contenu</title>
<author><name sortKey="Al Hulou, Rim" sort="Al Hulou, Rim" uniqKey="Al Hulou R" first="Rim" last="Al Hulou">Rim Al Hulou</name>
</author>
<author><name sortKey="Napoli, Amedeo" sort="Napoli, Amedeo" uniqKey="Napoli A" first="Amedeo" last="Napoli">Amedeo Napoli</name>
</author>
<author><name sortKey="Nauer, Emmanuel" sort="Nauer, Emmanuel" uniqKey="Nauer E" first="Emmanuel" last="Nauer">Emmanuel Nauer</name>
</author>
</analytic>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>annotation</term>
<term>classification</term>
<term>ontologies</term>
<term>reasoning</term>
<term>semantic similarity</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr" wicri:score="-1493">Dans cet article, nous proposons une approche pour classifier des documents textuels à partir de leur contenu. Le contenu des documents est exprimé par des annotations représentées sous forme d'arbres. Étant donnée une hiérarchie d'annotations génériques, notre approche vise à rattacher une annotation spécifique à une ou plusieurs classes possibles dans la hiérarchie. Ce processus de classification repose sur une mesure de similarité qui permet de mesurer l'écart entre une annotation spécifique et une annotation générique. Un schéma d'algorithme de classification de documents est proposé à partir de cette mesure de similarité.</div>
</front>
</TEI>
<affiliations><list></list>
<tree><noCountry><name sortKey="Al Hulou, Rim" sort="Al Hulou, Rim" uniqKey="Al Hulou R" first="Rim" last="Al Hulou">Rim Al Hulou</name>
<name sortKey="Napoli, Amedeo" sort="Napoli, Amedeo" uniqKey="Napoli A" first="Amedeo" last="Napoli">Amedeo Napoli</name>
<name sortKey="Nauer, Emmanuel" sort="Nauer, Emmanuel" uniqKey="Nauer E" first="Emmanuel" last="Nauer">Emmanuel Nauer</name>
</noCountry>
</tree>
</affiliations>
</record>
Pour manipuler ce document sous Unix (Dilib)
EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 006695 | SxmlIndent | more
Ou
HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 006695 | SxmlIndent | more
Pour mettre un lien sur cette page dans le réseau Wicri
{{Explor lien |wiki= Wicri/Lorraine |area= InforLorV4 |flux= Main |étape= Exploration |type= RBID |clé= CRIN:al_hulou04b |texte= Une mesure de similarité sémantique pour la classification de documents par le contenu }}
This area was generated with Dilib version V0.6.33. |